Qui suis-je ?
L1 L2 Eco-géstion
L3 Eco
Master Analyse et politique économique
WTO Economic Research & Statistic Division, research intern
PhD Candidate in Law & Economics: Non-discriminatory injunctions in antitrust and regulation: a comparative analysis of zero-rating plans
HarvardX - Data Scientist (R)
OpenClassrooms - Data Scientist (Python)
Consultant Data: indépendant puis salarié pour Data Efficiency
Selon vous, qu’est-ce qui est le plus précieux : les données elles-mêmes ou la manière dont elles sont utilisées ?
Petite histoire de la data :
Premier producteur officiel de statistiques (données) nationales: Tabellverket (Bureau des Tables), Suède, 1749. Issu des premiers recensements ordonnés par la Suède à l’Eglise de Suède en 1686.
France: Bureau de statistique, rattaché au ministère de l’Intérieur. Créé en 1800 à des fins de recensement et d’enquête sur les départements (nouvelle organisation territoriale). Aboutira en “INSEE” en 1946.
Le bureau américain du recensement lance un concours en 1886 pour améliorer le processus de recensement.
Herman Hollerith (1860-1929) gagne en brevetant une carte perforée pour “relever” ces statistiques.
En 1896 il fonde IBM.
IBM qui développera notamment les bases de données relationnelles (SQL), système de code barre, DRAM etc..
-> D’un besoin analytique naissent les outils de collecte, traitement ou classification.
Usage : définir un itinéraire
Données : geoloc satellite, carte routière
Usage : optimisation d’itinéraire
Données : traffic, modes de transport
Usage : Brest ok mais…
Données : monuments, photo des lieux, commerces, horaires d’ouverture, menu des restaurants etc…
Usage : “ah d’accord je n’y vais pas!”
-> Aide à la décision
Selon vous, qu’est-ce qui est le plus précieux : les données elles-mêmes ou la manière dont elles sont utilisées ?
Les données n’ont que peu de valeur si elles ne sont pas transformées en insight(s) exploitable(s).
C’est la demande qui guide l’offre de données. Si cette dernière n’est pas actionable, c’est une information inutile dans le contexte de l’analyse de données/l’analyse économique.
Data Engineer : Mise en place et gestion de l’infrastructure et des flux des données de la collecte à la restitution de la donnée (toute la chaine de vie de la data).
Data Scientist : Création de modèles pour résoudre des problèmes complexes et enrichir les données et analyses en aval.
Data Analyst : Compréhension, interprétation et représentation des données pour répondre au besoin exprimé par le client.
Projet Netflix initialement : https://en.wikipedia.org/wiki/Netflix_Prize
Objectif business
Retenir le client sur la plateforme
Méthode
Améliorer les recommandations faites aux utilisateurs
Quel professionnel de la data a un rôle majeur à jouer ici?
Le Data Scientist ! Besoin d’analyses approfondies/de modélisation
La data est majoritairement décentralisée sur data-center/cloud (car les volumes sont vite limitants).
Ex: Netflix movie recommendation algorithm.
La diversité des solutions est énorme…
Multiplicité : plateformes, langages, logiciels, type de licencing.
Enjeu: Unicité. Un maximum d’usage distincts au même endroit, même gouvernance, même architecture etc. Notamment car IA
Microsoft semble clairement en avance dans ce domaine.
1978 : Loi Informatique et Libertés
La première loi française majeure en matière de protection des données, adoptée le 6 janvier 1978.
Objectifs :
Protéger les libertés individuelles face au développement de l’informatique.
Réguler les traitements de données personnelles (collecte, utilisation, stockage).
Création de la CNIL (Commission Nationale de l’Informatique et des Libertés), une autorité administrative indépendante chargée de veiller à l’application de la loi.
2004 : Révision de la loi Informatique et Libertés
Intégration de la directive européenne de 1995 sur la protection des données personnelles.
Introduction de nouveaux droits pour les citoyens, notamment le droit d’accès et de rectification des données.
Renforcement des pouvoirs de contrôle et de sanction de la CNIL.
Règlement Général sur la Protection des Données (RGPD)
Adopté au niveau européen et entré en application le 25 mai 2018.
Objectifs :
Uniformiser la réglementation sur la protection des données personnelles dans l’UE.
Renforcer les droits des individus (portabilité des données, consentement explicite, droit à l’effacement).
Offrir à tout individu présent sur le territoire européen les mêmes droits face au traitement de ses données.
Imposer des obligations strictes aux entreprises (Privacy by Design, tenue de registres, notification des violations).
Impacts en France : Adaptation de la loi Informatique et Libertés pour être compatible avec le RGPD.
Environ 70 pays ont mis en place une régulation directement inspirée du RGPD, qui fait figure de standard mondial.
Paradigmes parfois opposés: Chine
Rien au niveau fédéral
CCPA (California Consumer Privacy Act) – États-Unis (Entrée en vigueur : 1er janvier 2020).
Objectif principal : Offrir aux résidents de Californie des droits ressemblants à ceux du RGPD, avec un accent sur la transparence et le contrôle des données personnelles.
Droits des consommateurs :
Droit de savoir quelles données sont collectées, utilisées, vendues ou partagées.
Droit de demander la suppression des données personnelles.
Droit de refuser la vente de leurs données (opt-out).
Obligations pour les entreprises d’informer les utilisateurs sur les données collectées, et leur permettre un accès et une suppression des données.
Applicabilité variable : seules les entreprises générant plus de 25 millions USD de revenus ou manipulant des données de plus de 50 000 consommateurs californiens.
Le CPRA (California Privacy Rights Act), en vigueur depuis 2023, renforce le CCPA avec de nouveaux droits et la création d’une agence dédiée à la protection des données.
Avis rendu par l’ARCEP en octobre 2024, consultation publique ouverte jusque mi-décembre 2024.
Deux pistes proposées :
- Encadrer les frais de transfert de données entre fournisseurs (à l’instar des Telecom)
- Préciser les règles d’interoperabilité, de portabilité et d’ouverture des interfaces (= promouvoir le multi-plateformes)
L’Autorité de la Concurrence (FR) estime que Nvidia contrôlerait plus de 80% du marché de l’infrastructure IA.
Inquiétudes:
- Fixation des prix
- Restrictions de production
- Conditions contractuelles injustes
- Comportement discriminatoires
Les USA (Department of Justice) s’interrogent également si l’entreprise a franchi le cap du monopole.